# html_cleaner_until.py
import html2text

def html_to_markdown(html: str) -> str:
    h = html2text.HTML2Text()
    h.ignore_links = True        # 保留超链接
    h.ignore_images = False        # 不保留图片（设为 False 则保留图片链接）
    h.ignore_tables = True       # 保留表格结构
    h.ignore_emphasis = False     # 保留粗体/斜体
    h.body_width = 0              # 不强制换行
    return h.handle(html).strip()
